수치 해석학: 보간을 넘어선, 근사의 철학

보간은 데이터가 완전히 정제되어 있다고 가정합니다. 현실 세계에서는 데이터가 혼란스럽고 흔들리며 잡음으로 가득 차 있습니다. 우리가 모든 데이터 포인트에 정확히 맞추려는 강요를 할 때, 우리는 진실을 찾지 못하고 오히려 혼란을 찾게 됩니다. 오늘 우리는 엄격한 정확성 요구를 넘어서 근사의 철학으로 나아갑니다. 근사.

정확성의 실패

고차 다항식은 모든 데이터 포인트에 도달할 수 있지만, 종종 '룬게 유사'한 진동을 일으킵니다. 이러한 극단적인 진동은 실제 물리적 과정과 전혀 관련이 없습니다. 따라서 근사 함수가 데이터와 정확히 일치해야 한다고 요구하는 것은 합리적이지 않습니다특히 측정값이 변동성을 포함할 경우 더욱 그렇습니다.

'최적' 피팅 정의하기: 세 가지 노름

근사하려면 오차 함수 $E$를 정의해야 합니다. '근접함'을 어떻게 측정하느냐에 따라 결과는 완전히 달라집니다:

1. 최소극대 문제 ($L_{\infty}$)

최대 가능한 오차를 최소화하려는 시도:

$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$

단점: 최소극대 접근법은 잘못된 데이터 일부에 대해 지나치게 큰 가중치를 부여하는 경향이 있습니다.

2. 절대 편차 ($L_1$)

절대 차이의 합:

$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$

단점: 절댓값 함수는 원점에서 미분 가능하지 않으며, 이 두 방정식의 해를 해석적으로 구할 수 없을 수도 있습니다.

3. 최소 제곱의 우위 ($L_2$)

수치 해석의 기준이며 잔차를 제곱하는 것:

$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$

이는 미적분학이 전역 최소값을 쉽게 찾을 수 있는 매끄럽고 미분 가능한 표면을 만듭니다.

해석적 제약 조건

측정 기준을 선택하는 것은 논리와 미적분학의 균형입니다. 예를 들어, 절대 편차 방법은 근사와 크게 어긋난 점에 충분한 가중치를 주지 않지만, $L_2$는 하나의 이상한 데이터 포인트에 의해 완전히 좌우되지 않으면서 큰 이상치를 효과적으로 처벌하는 견고한 중간 지점을 제공합니다.

🎯 핵심 원칙

근사는 잡음을 무시하고 신호를 찾는 예술입니다. 포인트 매칭에서 오차 최소화로 전환함으로써, 측정 변동성에 의해 가려진 진짜 물리 법칙을 되찾을 수 있습니다.

질문 1

왜 고차 보간 다항식은 실험 데이터에 자주 부적합한 선택일까요?

복잡한 물리학을 표현하기 위해 계산적으로 너무 단순합니다.

잡음보다 추세를 포착하는 데 더 많은 '룬게 유사'한 진동을 초래합니다.

항상 데이터 곡률을 무시하는 선형 결과를 산출합니다.

어느 점에서도 미분 불가능합니다.

질문 2

'최소극대' 문제에서 주로 사용되는 오차 노름은 무엇입니까?

L1 노름(절대 편차의 합)

L2 노름(최소 제곱)

L∞ 노름(최대 절대 오차)

그람-슈미트 노름

질문 3

절대 편차(L1) 방법의 주요 계산적 단점은 무엇입니까?

작은 이상치에 너무 민감합니다.

모든 계산에 체비셰프 다항식을 사용해야 합니다.

절댓값 함수는 원점에서 미분 가능하지 않습니다.

100개 이상의 데이터 포인트를 가진 데이터셋에서만 작동합니다.

질문 4

어떤 노름이 큰 이상치를 크게 처벌하면서도 한 개의 오류가 전체 피팅을 지배하게 하지 않도록 균형을 맞추나요?

L1 노름

L2 노름(최소 제곱)

L∞ 노름

룬게 노름

질문 5

낙하 물체 사례에서, 왜 고차 다항식보다 최소 제곱 2차식을 사용할까요?

물체가 직선으로 움직임을 보장하기 위해.

카메라 받침대의 모든 진동을 포착하기 위해.

카메라의 '자외선'을 무시하고 중력의 물리 법칙(y = at²)을 회복하기 위해.

고속 카메라가 3개 이상의 데이터 포인트를 기록할 수 없기 때문입니다.

도전: 고급 근사 이론

패데와 이산 최소 제곱의 숙련

근사 이론은 유리 함수와 특정 데이터 분석으로 확장됩니다. 이러한 고급 개념들의 이해를 시험해보세요.

질문 1

$f(x) = e^{2x}$에 대한 모든 2차 패드에 근사치를 결정하세요. $x = 0.2, 0.4, 0.6, 0.8, 1.0$에서 결과를 비교하세요.

모델 솔루션:
$e^{2x}$의 매클로린 급수는 $1 + 2x + 2x^2 + \frac{4}{3}x^3 + \dots$입니다. 2차 패드에 $R_{n,m}(x) = P_n(x)/Q_m(x)$이고 $n+m=2$입니다:

$R_{2,0}$ (테일러): $1 + 2x + 2x^2$
$R_{1,1}$: $\frac{1+x}{1-x}$
$R_{0,2}$: $\frac{1}{1-2x+2x^2}$

$x=1$일 때, $e^2 \approx 7.389$. $R_{2,0}(1) = 5$. $R_{1,1}$는 정의되지 않음. $R_{0,2}(1) = 1$. 이는 낮은 차수의 패드에 근사치가 특정 유효 영역을 가짐을 보여줍니다.

질문 2

$\phi_0(x) = 2, \phi_1(x) = x - 3, \phi_2(x) = x^2 + 2x + 7$가 주어졌을 때, 임의의 이차식 $Q(x) = a_0 + a_1x + a_2x^2$가 선형 조합 $c_0\phi_0 + c_1\phi_1 + c_2\phi_2$로 표현될 수 있음을 보여주세요.

모델 솔루션:
이는 기저 변경 문제입니다. $\phi_i$의 차수를 보면 $\text{deg}(\phi_0)=0, \text{deg}(\phi_1)=1, \text{deg}(\phi_2)=2$입니다. 서로 다른 차수의 다항식이므로, $\mathbb{P}_2$에서 선형 독립입니다.
1. $a_2x^2$는 $c_2\phi_2$에서 나와야 하므로 $c_2 = a_2$입니다.
2. 선형 항 $a_1x$는 $c_1(x-3) + c_2(2x)$로 매칭됩니다.
3. 상수항 $a_0$는 $c_0(2) + c_1(-3) + c_2(7)$로 매칭됩니다. 주계수들이 삼각형 시스템을 형성하기 때문에, $c_i$에 대한 유일한 해가 항상 존재합니다.

질문 3

무게 $F$와 길이 $l$ 데이터가 다음과 같다고 가정합니다: $F=[2, 4, 6]$, $l=[7.0, 9.4, 12.3]$. 최소 제곱선 $l = mk + b$ (또는 $F = kl$)를 찾아보세요.

모델 솔루션:
여기서 $x = F, y = l$라고 하겠습니다. $\sum x = 12, \sum y = 28.7, \sum x^2 = 56, \sum xy = 127.4$. 정규 방정식: $3b + 12m = 28.7$ $12b + 56m = 127.4$ 해: $m = 1.325$, $b = 4.267$. 스프링 상수에 대한 최소 제곱 근사($F=kl$인 경우)는 원점을 통과하는 직선이어야 하지만, 데이터는 초기 길이 오프셋 $b$를 시사합니다.